엔비디아는 수요일, 인공지능(AI) 워크로드 처리에 탁월한 그래픽 처리 장치(GPU) 덕분에 급증한 수익을 기록하며 모든 기대를 뛰어넘었습니다. 하지만 다른 종류의 AI 칩도 점차 탄력을 받기 시작했습니다.
구글의 TPU부터 아마존의 Trainium, 브로드컴과의 OpenAI 협력 계획에 이르기까지 모든 주요 클라우드 제공업체는 현재 자체 주문형 반도체(ASIC)를 설계하고 있습니다. 이러한 칩은 더 작고, 저렴하며, 사용하기 쉬우며, 엔비디아 GPU에 대한 의존도를 낮출 수 있습니다. 퓨처럼 그룹의 다니엘 뉴먼은 CNBC와의 인터뷰에서 ASIC 칩이 "향후 몇 년 동안 GPU 시장보다 더 빠르게 성장할 것"이라고 예상했습니다.
GPU와 ASIC 외에도 신호 처리, 네트워킹, AI 등의 용도로 제조 후 재구성이 가능한 현장 프로그래밍 가능 게이트 어레이(FPGA)가 있습니다. 또한, 클라우드가 아닌 기기에서 직접 실행되도록 설계된 차세대 AI 칩이 있는데, 퀄컴과 애플과 같은 기업들이 이 분야를 주도하고 있습니다.
CNBC에서는 주요 기술 기업의 전문가와 내부 관계자들과 인터뷰를 통해 이러한 복잡한 상황과 다양한 종류의 AI 칩에 대해 분석했습니다.
일반 컴퓨팅을 위한 GPU
GPU는 한때 주로 비디오 게임에 사용되었지만, 현대 AI의 엔진으로 자리 잡으면서 엔비디아는 세계에서 가장 가치 있는 상장 기업으로 거듭났습니다. 엔비디아는 작년에 현세대 "블랙웰" GPU를 약 600만 대 판매했습니다.
게임에서 AI로의 전환은 2012년, 연구자들이 엔비디아 GPU를 사용하여 신경망 알렉스넷(AlexNet)을 학습시키면서 시작되었습니다. 많은 사람들이 이를 현대 AI 혁명의 불씨로 보고 있습니다. 알렉스넷은 유명 이미지 인식 대회에서 경쟁하며 CPU 대신 GPU를 사용하여 놀라운 정확도와 강력한 경쟁 우위를 제공했습니다.
GPU가 실제와 같은 그래픽을 렌더링할 수 있게 하는 동일한 병렬 처리 능력은 명시적 프로그래밍이 아닌 데이터로부터 학습하는 딥 러닝 모델을 훈련하는 데에도 이상적입니다.
오늘날 GPU는 클라우드 기반 AI 워크로드를 실행하기 위해 CPU와 함께 데이터 센터 시스템에 판매됩니다. CPU는 순차적 작업을 위한 소수의 강력한 코어를 가지고 있는 반면, GPU는 행렬 곱셈과 같은 병렬 연산에 특화된 수천 개의 작은 코어를 가지고 있습니다.
GPU는 엄청난 양의 연산을 동시에 실행할 수 있기 때문에 학습과 추론 모두에 이상적입니다. 학습은 AI 모델이 방대한 데이터 세트에서 패턴을 찾도록 가르치고, 추론은 이러한 모델을 활용하여 새로운 정보에 대한 결정을 내립니다.
GPU는 여전히 엔비디아와 가장 가까운 경쟁사인 AMD의 주요 엔진입니다. 소프트웨어는 두 회사의 주요 차별화 요소입니다. 엔비디아는 CUDA 생태계에 의존하는 반면, AMD는 대부분 오픈소스 스택을 제공합니다.
두 회사 모두 Amazon, Microsoft, Google, Oracle, CoreWeave 등의 공급업체에 클라우드 GPU를 판매하고, 이들은 컴퓨팅 성능을 AI 개발자에게 임대합니다.
예를 들어, 앤트로픽이 엔비디아와 마이크로소프트와 체결한 300억 달러 규모의 계약에는 엔비디아 하드웨어를 기반으로 구축된 1기가와트 규모의 컴퓨팅 용량이 포함됩니다. AMD는 최근 OpenAI와 오라클로부터도 주요 계약을 확보했습니다.
엔비디아는 정부와 AI 기업에 직접 판매하기도 하는데, 여기에는 OpenAI에 최소 400만 개의 GPU가 판매되고, 한국, 사우디아라비아, 영국 등 외국 정부에도 판매됩니다.
이 회사는 CNBC에 72개의 Blackwell GPU가 들어 있는 서버 캐비닛당 약 300만 달러를 청구하고 있으며, 매주 약 1,000개의 캐비닛을 배송하고 있다고 밝혔습니다.
엔비디아의 AI 인프라 담당 시니어 디렉터인 디온 해리스는 수요가 이 정도까지 증가할 것이라고는 상상도 못했다고 말했습니다. "몇 년 전 8개의 GPU 시스템에 대해 기업들과 이야기를 나누었을 때, 그들은 과도하다고 생각했습니다."
전문화된 클라우드 AI를 위한 ASIC
GPU 기반 학습은 대규모 언어 모델의 초기 물결을 주도했지만, 모델이 발전함에 따라 추론의 중요성이 점점 더 커졌습니다. 추론은 특정 수학 연산을 위해 특별히 제작된 유연성이 떨어지고 비용이 저렴한 칩에서도 실행될 수 있으며, 바로 이 부분에서 ASIC이 등장합니다.
GPU가 여러 가지 병렬 작업을 실행할 수 있는 "스위스 군용 칼"이라면 ASIC은 단일 용도의 도구입니다. 매우 빠르고 효율적이지만 일단 제조되면 한 가지 유형의 작업에만 국한됩니다.
"이 칩들은 실리콘에 식각된 후에는 바꿀 수 없습니다."라고 *칩 워*의 저자 크리스 밀러는 말했습니다. "효율성과 유연성 사이에는 상충 관계가 있습니다."
엔비디아의 GPU는 수많은 AI 요구를 충족할 만큼 다재다능하지만, 가격이 비싸고(개당 최대 4만 달러) 구하기도 어렵습니다. 스타트업들이 엔비디아 GPU에 의존하는 이유 중 하나는 맞춤형 ASIC 설계에 수천만 달러의 비용이 들 수 있기 때문입니다.
하지만 클라우드 거대 기업들은 ASIC에 많은 투자를 하고 있는데, 이는 대규모로 적용 시 큰 비용 절감 효과를 약속하기 때문입니다.
뉴먼은 "이러한 기업들은 자신들이 구축하는 워크로드에 대한 통제력을 강화하고 싶어합니다."라고 말했습니다. "하지만 그들은 엔비디아와 AMD와도 계속 협력할 것입니다. 컴퓨팅 수요가 엄청나기 때문입니다."
구글은 최초로 맞춤형 AI ASIC을 개발하여 2015년 텐서 프로세싱 유닛(TPU)을 출시했습니다. 작업은 2006년에 시작되었지만, 구글이 AI로 인해 데이터 센터 설치 공간이 두 배로 늘어날 수 있다는 사실을 깨달은 2013년에 시급한 과제가 되었습니다. 2017년, TPU는 대부분의 최신 AI를 뒷받침하는 트랜스포머 아키텍처를 구현하는 데 기여했습니다.
구글은 11월에 7세대 TPU를 공개했습니다. Anthropic은 100만 개의 TPU를 사용하여 클로드 모델을 학습시킬 예정입니다. 일각에서는 TPU가 엔비디아 GPU와 경쟁하거나 더 나은 성능을 보인다고 주장합니다.
밀러는 "많은 사람들이 구글이 결국 TPU를 더 광범위하게 출시할 것으로 예상합니다."라고 말했습니다.
AWS는 2015년 Annapurna Labs를 인수한 후 자체 칩을 출시했습니다. 2018년에는 Inferentia를, 2022년에는 Trainium을 출시했으며, Trainium3도 곧 출시될 예정입니다.
Amazon은 Trainium이 다른 경쟁 제품보다 가격 대비 성능이 30~40% 더 우수하다고 말합니다. Anthropic은 현재 50만 개의 Trainium2 칩을 사용하여 모델을 학습시키고 있습니다.
맞춤형 ASIC을 개발하기 위해 클라우드 공급업체들은 브로드컴이나 마벨과 같은 기업에 의존합니다. 이들은 핵심 IP 및 네트워킹 전문 지식을 제공합니다. 밀러는 "이것이 브로드컴이 AI 붐의 최대 수혜자 중 하나가 된 이유입니다."라고 말했습니다.
Broadcom은 Google의 TPU와 Meta의 2023 가속기를 설계하는 데 도움을 주었으며, 2026년부터 OpenAI를 위한 맞춤형 칩을 개발하고 있습니다.
마이크로소프트는 마이아 100을 개발했고, 퀄컴은 A1200을 보유하고 있습니다. 인텔은 가우디 제품군을 제공하고, 테슬라는 AI5 칩을 개발하고 있습니다. 세레브라스(Cerebras)와 그록(Groq) 같은 스타트업들은 혁신적인 아키텍처를 개발하고 있습니다.
중국에서는 화웨이, 바이트댄스, 알리바바가 미국 수출 제한에도 불구하고 자체 ASIC을 설계하고 있습니다.
NPU 및 FPGA를 사용한 장치 수준 AI
세 번째 유형의 AI 칩은 클라우드가 아닌 기기에서 직접 모델을 실행하도록 설계되었습니다. 이러한 칩은 일반적으로 시스템온칩(SoC) 설계에 통합되어 있으며, 엣지 AI 프로세서라고 합니다. 이 칩은 AI 기능을 로컬에서 효율적으로 실행하여 배터리 수명과 개인정보 보호를 보호합니다.
전 백악관 AI 및 기술 고문 사이프 칸은 "매우 낮은 지연 시간으로 휴대폰에서 직접 AI 작업을 실행할 수 있게 될 것입니다."라고 말했습니다. "데이터 센터로 데이터를 전송할 필요도 없습니다."
신경 처리 장치(NPU)는 Qualcomm, Intel, AMD 등이 개발한 이 범주의 주요 부분입니다.
Apple은 NPU라는 용어를 사용하지 않지만 M 시리즈 Mac 칩과 A 시리즈 모바일 칩에 "신경 엔진"을 내장했습니다.
애플 플랫폼 아키텍처 담당 부사장인 팀 밀렛은 "이러한 접근 방식은 매우 효과적임이 입증되었습니다."라고 말했습니다. "빠르고 사용자 경험에 대한 제어력을 강화할 수 있습니다."
안드로이드 폰의 스냅드래곤 칩, 삼성의 맞춤형 NPU, NXP와 Nvidia의 엣지 AI 프로세서는 자동차, 로봇, 카메라, 스마트 홈 기기의 AI를 구동합니다.
밀러는 "현재 지출의 대부분은 여전히 데이터 센터에 집중되어 있습니다."라고 말하며, "하지만 AI가 휴대폰, 자동차, 웨어러블 등 모든 기기로 확산됨에 따라 이러한 상황은 바뀔 것입니다."라고 덧붙였습니다.
FPGA는 제조 후 재프로그래밍이 가능하기 때문에 더 많은 유연성을 제공하지만 ASIC이나 NPU보다 전력 효율성은 낮습니다.
AMD는 2022년에 490억 달러에 Xilinx를 인수한 후 최대 FPGA 제조업체가 되었습니다. Intel은 2015년에 167억 달러에 Altera를 인수한 후 2위를 차지했습니다.
결론: 엔비디아는 여전히 훨씬 앞서 있습니다.
이 모든 AI 칩 회사는 대만의 TSMC라는 한 제조업체에 의존합니다.
TSMC는 애리조나에 대규모 제조 시설을 건설 중이며, 애플은 생산 시설 일부를 이곳으로 이전할 예정입니다. 엔비디아 CEO 젠슨 황은 지난 10월 블랙웰 GPU도 그곳에서 "본격 생산"에 들어갔다고 밝혔습니다.
시장이 점점 더 경쟁이 치열해지고 있음에도 불구하고, 엔비디아를 앞지르는 것은 여전히 매우 어렵습니다.
뉴먼은 "엔비디아가 이 자리에 오른 것은 스스로의 노력 덕분입니다."라고 말했습니다. "엔비디아는 수년간 개발자 생태계를 구축해 왔고, 결국 승리했습니다."
대부분의 미국 주식 지수는 연방준비제도 이사회의 금리 인하에 대한 낙관론이 다시 고개를 들면서 금요일에 상승했습니다.
뉴욕 연방준비은행 총재 존 윌리엄스는 금요일 중앙은행이 금리를 인하할 여력이 더 커질 것으로 예상한다고 밝혔습니다. 칠레에서 연설한 이 영향력 있는 정책위원은 현재 노동 시장 위험이 인플레이션 위험보다 크다고 지적하며, FOMC 내 비둘기파 위원들의 입장과 일치했습니다.
윌리엄스는 "통화 정책은 여전히 다소 긴축적인 것으로 보이나, 최근 조치 이전보다는 완화된 것으로 판단합니다. 따라서 연방기금금리 목표 범위를 단기적으로 추가로 조정하여 정책을 중립에 더 가깝게 하고 두 목표 사이의 균형을 유지할 여지가 있다고 생각합니다."라고 말했습니다.
16시 15분(GMT) 기준, 다우존스 산업평균지수는 0.4%(185포인트) 상승한 45,937을 기록했습니다. S&P 500 지수는 0.1%(7포인트) 상승한 6,545를 기록했고, 나스닥 종합지수는 0.1%(38포인트) 상승한 22,040을 기록했습니다.
팔라듐 가격은 금요일에 하락세를 이어갔는데, 이는 미국 달러 강세, 수요 불확실성, 공급 증가에 대한 기대감에 따른 것입니다.
로이터 통신은 정보통을 인용해 미국이 우크라이나에 러시아와의 휴전 협정을 수용하도록 비공개적으로 압력을 가하고 있다고 보도했습니다. 이러한 움직임은 세계 최대 팔라듐 수출국 중 하나인 러시아에 대한 제재가 완화됨에 따라 산업용 금속의 세계 공급을 증가시킬 것으로 예상됩니다.
Capital.com에 따르면 팔라듐 가격은 10월 초 이후 약 26% 상승하여 온스당 약 1,500달러를 기록했습니다. 이러한 급등세는 플래티넘 시장의 상승세와 더불어 세계 금융 시장의 전반적인 완화에 힘입은 것입니다.
미국 금리 인하와 달러의 초기 약세에 대한 베팅도 최근 몇 주 동안 귀금속 가격을 끌어올린 소위 "금 + 유동성" 랠리의 일환으로 팔라듐을 지지했습니다.
팔라듐은 가솔린 엔진의 촉매 변환기에 거의 독점적으로 사용되기 때문에 가격 변동성은 미국 자동차 제조업체와 전자 제조업체의 비용 구조에 직접적인 영향을 미칩니다.
모넥스(Monex)의 기술적 분석에 따르면 온스당 1,500달러에서 1,520달러 사이에 저항선이 형성되어 있으며, 전반적인 강세 추세가 예상되지만 향후 거래는 여전히 불안정할 것으로 예상됩니다. CPM 그룹의 애널리스트들은 팔라듐의 최근 강세가 "플래티넘의 실적과 밀접한 관련이 있다"고 지적하며, 미국 노동 시장의 약세와 지속적인 인플레이션이 수요에 부정적인 영향을 미칠 수 있다고 경고했습니다.
최근 발표된 미-중 무역 휴전에도 불구하고, 미국 관리들의 발언은 긴장이 여전히 고조되고 있음을 시사합니다. 미국 재무장관은 중국이 여전히 신뢰할 수 없는 무역 상대국이라고 말했고, 도널드 트럼프 대통령은 행정부가 중국이나 다른 국가로의 첨단 엔비디아 칩 수출을 허용하지 않을 것이라고 재차 강조했습니다.
미국 달러 지수는 GMT 기준 14시 43분 기준 0.1% 상승한 100.2를 기록했으며, 최고 100.4와 최저 99.9 사이에서 거래되었습니다.
12월 인도 팔라듐 선물은 GMT 14시 43분 기준 온스당 1,374달러로 0.9% 하락했습니다.
비트코인은 금요일 아침 81,871.19달러까지 잠시 하락한 후 82,460달러 근처에서 안정화되었는데, 이는 지난 24시간 동안 약 10.2% 하락한 수치입니다.
거의 한 달간 꾸준히 매도세를 보인 비트코인은 현재 올해 초 수준보다 10% 낮은 가격으로 거래되고 있으며, 지난해 도널드 트럼프가 선거에서 승리한 이후 얻은 이익의 대부분을 잃었습니다.
비트코인이 82,000달러 아래로 떨어진 마지막 시기는 4월로, 트럼프가 "광복절" 행사에서 광범위한 관세를 발표하면서 촉발된 광범위한 시장 매도 와중에 75,000달러까지 떨어졌습니다.
Coinbase가 소유한 옵션 및 선물 거래소인 Deribit의 데이터를 기반으로, CoinDesk는 거래자들이 추가 하락에 대비하고 있다고 보고했습니다.
시가총액 기준 두 번째로 큰 암호화폐인 이더리움은 2,740달러 아래로 떨어져 24시간 동안 9.6% 이상 하락했습니다. 다른 주요 토큰들도 큰 폭의 하락을 보였는데, XRP, BNB, SOL은 각각 9.1%, 8.4%, 10.6% 하락했습니다. 가장 큰 밈 코인인 도지코인은 같은 기간 동안 10.3% 하락했습니다.
지난달 초 최고치를 경신한 이후 암호화폐 시장은 10월 10일 전례 없는 단 하루 폭락 이후 꾸준한 하락세를 보였습니다. 당시 193억 7천만 달러 상당의 레버리지 포지션이 24시간 만에 청산되었습니다. 이 사건은 트럼프 대통령이 중국 수입품에 100% 추가 관세를 부과하겠다고 발표하면서 촉발되었지만, 이후 트럼프 대통령은 철회했습니다. 코인글래스에 따르면 디지털 자산 또한 최근 시장 변동성에 휩쓸려 24시간 동안 22억 달러 이상이 청산되었습니다.
코인게코(CoinGecko)에 따르면 현재 모든 암호화폐의 총 시가총액은 2조 9,200억 달러로, 10월 초 최고치였던 약 4조 3,800억 달러에서 33% 하락했습니다. 블룸버그에 따르면 이달 초 이후 비트코인 시가총액은 약 25% 하락하며 2022년 암호화폐 폭락 이후 가장 큰 폭의 월간 하락률을 기록했습니다.
막대한 보유량으로 비트코인의 대용품으로 널리 알려진 Strategy(구 MicroStrategy)의 주가는 지난주 11%, 지난 30일 동안 41% 하락한 데 이어 금요일 장전 거래에서 2.44% 하락했습니다. Strategy는 현재 649,870 BTC를 보유하고 있으며, 평균 매수가는 74,430달러입니다.
이번 주 초 JP모건 애널리스트들은 Strategy가 나스닥 100과 MSCI USA 등 주요 지수에서 제외될 위험에 직면해 있다고 경고했습니다. 이러한 제외는 Strategy의 주가 하락을 더욱 부추길 수 있으며, 만약 회사가 비트코인 보유 자산의 일부를 매각해야 할 경우 암호화폐 시장에 부정적인 영향을 미칠 수 있습니다.